[レポート] LINE Score:独自のスコアリングサービスをいかに構築したか #linedevday_report
LINE Score:独自のスコアリングサービスをいかに構築したか
2019年11月20日(水)・21日(木)にグランドニッコー東京 台場でLINEのデベロッパーカンファレンス「LINE DEVELOPER DAY 2019」が開催されました。
本記事は、セッション「LINE Score:独自のスコアリングサービスをいかに構築したか」をレポートします。
スピーカー
Sangwoo Kim(LINE Plus)
LINE Financial Plusで信用リスク管理の専門家兼モデレーターとして勤務。LINE入社前は、信用調査機関で、金融機関向けの信用評価モデル構築に関する信用リスク・コンサルタントとして勤務していました。
LINE Credit株式会社(日本)が提供する独自のスコアリングサービス「LINE Score」の開発に携わり、現在はLINE Bank設立準備会社(日本)だけでなく、台湾、インドネシアで提供予定のデジタルバンキングサービスの開発責任者も務めています。
セッション概要
LINEは先ごろ、独自のスコアリングサービスとして「LINE Score」を発表しました。「日々をちょっと豊かに」というコンセプトに合わせ、「LINE Score」に基づいた様々なベネフィットを提供しております。
特に、信用履歴が不十分なため融資を受けられない顧客へのアクセシビリティを強化するために、積極的にLINEスコアを活用することに取り組んでいます。
また、 LINE Scoreでは、8月より、スコアを活用した個人向けローンサービス「LINE Pocket Money」も展開しています。従来の信用情報に加え、 LINE Scoreを掛け合わせることでユーザー一人ひとりに応じたローンサービスを提供しております。
近年ではライフスタイルが多様化し、フリーランスや自営業などを選択する方もいます。従来の与信判断に加えて、スコアリングサービスでは、金融ビジネス、特に融資サービスにおいて非常に重要な役割を果たしています。
過去の金融取引履歴などの信用評価には従来、「財務データ」が主に用いられていました。しかし近年は、財務以外の様々なデータを用いたスコアリングサービスが注目を集めています。
本セッションでは、スコアリングモデルの構築方法について順を追ってご説明したいと思います。
スライド
レポート
クレジットスコアリングモデルについて
- ツールとして、お客様が返済してくれるかどうかを予測するもの
- 返さないと予測されるお客様には貸すのを控える。
- どれくらいの金額を、どのように貸すときちんと返済を受けられるか?
クレジットスコアリングのモデルを作るというのは、これらを決めるための予測モデルを作ること。
従来型のクレジットスコアリングモデル
- 金融データを使って格付けを行う
- 支払い履歴
- ローン利用状況 etc.
-> 先進国で使用される。それなりの金融サービスの履歴の情報が必要になるため。
代替クレジットスコアリングモデル
- 金融データ以外を元に、格付けを行う
- スマホから収集できるデータにより、判断することもできる
- 行動履歴
- SNS
- 通話・通信量
- 通信料の支払い etc.
-> 金融データが揃っていなくても与信判断が可能になる。
LINE Score
Enrich Daily Score
LINE Scoreは、ユーザーの生活を豊かにすることを目的としている。
一部のハイテク企業では勝手にユーザ情報を利用しているのではないかと思われているが、LINEではそうしたことはしていない。
特徴は…
- LINEの提供する様々なサービスから得られたデータから分析を行なっている。
- 複数の情報を組み合わせることで、信用度をより正確に測ることができる。
- 他のシステムに比べて、はるかに広い顧客カバレッジを持っているのが強み。
長期的にはLINEポケットマネーやLINE Financial、LINE Payとの連携はもちろん、プラットフォームを構築することを目的としている。
クレジットスコアリングモデルの構築方法
[キーワード]
- デフォルト(債務不履行) : 60日以上、90日以上の返金遅れ
- フィーチャー : デフォルトを予測するのに使用される情報
-> クレジットスコアリングモデルは、フィーチャーを利用して、デフォルトを適切に予測するのを目的に開発されている、と言える。
LINEポケットマネーとLINE Financialでは、過去の金融取引による従来通りの審査のほか、代替クレジットスコアリングモデルも使って効果的な審査が行われる予定。
スコアリングモデルを構築する5つのStep
1.purpose of model
- ビジネスに合わせて、予測すべき対象を決める。
- 債務不履行の可能性、債権回収の可能性、詐欺の可能性 etc.
2.target definition
- 予測する対象によって、使用する情報が変わってくる。
- 与信、回収、不正の検出、早期警戒 etc.
3.feature creation & selection
- スコアリングに適した情報を選択する。
- フィーチャーの例
- 電話の種類(ガラケー、スマホ)
- 通話回数
- 利用時間帯
- メッセージの受送信の比率
- 主なタイムゾーン etc.
- 最適なフィーチャーを選択する際には、対象を測るのに意味があるかどうかだけでなく、安定して使えるか、互いに相関の強すぎる情報同士が入っていないかなどを確認する。
4.model fitting
- 以前はロジスティック回帰モデルがよく利用されていたが、現在は機械学習が適用されることが増えてきている。
- ロジスティック解析で作られたモデルは、一般に説明が楽で、変数も少なかった。
- 機械学習では、説明がブラックボックスになりやすく、複雑になりやすい。また、大量のデータも必要になる。その代わり、精度が良い。
5.scaling & calibration
- 確率をスコアに変換することをscaling、スコアをグレードに分けることをcalibrationと呼んでいる。
LINE Scoreによって可能になるもの
- LINE Scoreに基づいた便益の提供
- 金融サービスへのアクセス性の向上
- 金融サービス提供者側にも、コスト削減のメリット
まとめ
圧倒的なユーザー数を誇るLINE利用者の行動データによるスコアリングということで、将来どんな使われ方がされていくのか、とても興味深いです。